強化學習（RL）範例實作分析

2025 iThome 鐵人賽

DAY 13

自我挑戰組

17th鐵人賽

368 瀏覽

FrozenLake（冰湖環境）
FrozenLake 是 OpenAI Gym 提供的經典 RL 測試環境：
地圖是格子狀，有冰面（可走）、陷阱洞（掉下去失敗）、終點（抵達成功）。
AI 每次可以選擇「上下左右」走一步。
如果走到終點就 +1 分，掉洞或其他狀況都是 0 分。

分析
狀態（State）：冰湖的每個格子位置，就是一個狀態。
動作（Action）：上下左右移動。
回饋（Reward）：到終點 = +1，其它 = 0。這種設計讓 AI 必須自己摸索路徑。

這個範例就像「走迷宮」，AI 一開始亂走，常常掉到洞裡；但隨著經驗累積，它會知道「哪裡不能走」、「哪條路通往終點」。最後它的策略會變成一條穩定的「最短路徑」。

系列文

AI Agentu相關研究共 30 篇

6 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

IT邦幫忙